Workshop Information Retrieval 2008 6 . - 8 . October 2008 , University of Würzburg , Germany

نویسندگان

  • Thomas Mandl
  • Norbert Fuhr
  • Andreas Henrich
چکیده

Plagiaterkennung in Programmen (Quellcode) funktioniert analog zu der in Texten: gegeben ist der Quellcode eines Programms dq sowie eine Kollektion D von Programmquellen. Die Retrieval-Aufgabe besteht darin, in dq alle Codeabschnitte zu identifizieren, die aus Dokumenten in D übernommen wurden. Im vorliegenden Papier werden Parallelen und Unterschiede zwischen der Plagiaterkennung in Texten und der in Computerprogrammen aufgezeigt, ein neues Maß zum Ähnlichkeitsvergleich kurzer Code-Abschnitte vorgestellt und erstmalig Fingerprinting als Technologie für effizientes Retrieval aus großen Codekollektionen (|D| ≈ 80.000) demonstriert. In den von uns durchgeführten Experimenten werden kurze Codeabschnitte ausD, die eine hohe Ähnlichkeit zu Abschnitten aus dq aufweisen, mit einer Precision von 0.45 bei einem Recall von 0.51 in konstanter Zeit gefunden.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

147th ENMC international workshop: guideline on processing and evaluation of sural nerve biopsies, 15-17 December 2006, Naarden, The Netherlands.

a Department of Neurology, University of Würzburg, Würzburg, Josef-Schneider-Str. 11, 97080 Würzburg, Germany b Department of Neuropathology, Institute of Neurology, London, United Kingdom c Department of Neurology, Mayo Clinic and Mayo Foundation, Rochester, United States d Department of Neurology, CHRU Dupuytren, Limoges, France e Department of Neurology, University of Tromsö, Tromsö, Norway ...

متن کامل

Influence of reconstruction on the surface state of Au(110)

Andreas Nuber,1,* Mitsuharu Higashiguchi,2 Frank Forster,1 Peter Blaha,3 Kenya Shimada,4 and Friedrich Reinert1,5 1Experimentelle Physik II, Universität Würzburg, Am Hubland, D-97074 Würzburg, Germany 2Graduate School of Science, Hiroshima University, Higashi-Hiroshima 739-8526, Japan 3Institute of Materials Chemistry, Vienna University of Technology, Getreidemarkt 9/165, A-1060 Vienna, Austria...

متن کامل

Summary of the 15th Discovery Challenge Recommending Given Names

1 University of Kassel, Knowledge Discovery and Data Engineering Group, Wilhelmshöher Allee 73, 34121 Kassel, Germany {mitzlaff, doerfel, mueller}@cs.uni-kassel.de 2 University of Würzburg, Data Mining and Information Retrieval Group, Am Hubland, 97074 Würzburg, Germany [email protected] 3 L3S Research Center, Appelstraße 4, 30167 Hannover, Germany {hotho, juergen.mueller, jaesc...

متن کامل

Cartesian Quasi-Random Sampling for Multiple Contrasts and Dynamic Imaging

P. Ehses, N. Seiberlich, M. Blaimer, F. Breuer, W. R. Bauer, and P. M. Jakob Dept. of Experimental Physics 5, Universität Würzburg, Würzburg, Germany, Department of Radiology, Case Western Reserve University and University Hospitals of Cleveland, Cleveland, Ohio, United States, Research Center Magnetic Resonance Bavaria (MRB), Würzburg, Germany, Dept. of Internal Medicine I, Universität Würzbur...

متن کامل

Precise predictions for LHC using a GOLEM

X iv :0 80 7. 06 05 v2 [ he pph ] 1 5 A ug 2 00 8 Precise predictions for LHC using a GOLEM T. Binoth, A. Guffanti, J.-Ph. Guillet, G. Heinrich, S. Karg, N. Kauer , P. Mertsch, T. Reiter, J. Reuter, and G. Sanguinetti School of Physics, The University of Edinburgh, Edinburgh EH9 3JZ, UK Department of Physics, University of Freiburg, Hermann-Herder-Str. 3a, D-79104 Freiburg, Germany LAPTH, 9, Ch...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008